Day 6 強化學習就是一直學習?

12th鐵人賽 machine learning

linitachi

2020-09-06 20:24:18

5728 瀏覽

分享至

強化學習就是一直學習?

介紹完監督式學習與非監督式學習，我們來介紹強化學習!根據wiki的定義

強化學習（英語：Reinforcement learning，簡稱RL）是機器學習中的一個領域，強調如何基於環境而行動，以取得最大化的預期利益。
擷取至wiki

可以看到，強化學習的精隨在於agent如何與環境的互動，來產生最大的利益。

簡介

強化學習總共有這幾個元素，Agent，Environment，Action，Reward。

取自https://www.terasoft.com.tw/support/tech_articles/reinforcement_learning_a_brief_guide.asp

Agent會採取Action，採取行動後，環境可能會被改變，而環境會給Agent一個Reward，讓Agent知道這Action好不好。

應用

那麼強化學習有什麼用處呢?
我們可以使用強化學習來訓練圍棋機器人!
知名的Alpha Go 就是基於強化學習來打敗人類的!
又或者學習如何玩超級馬力歐，透過一次又一次的死亡，Agent會慢慢地學習什麼時間點該跳躍閃避怪物，或者殺掉怪物。

那麼強化學習無敵了嗎?

當然不是的，強化學習需要大量的訓練，如果要在電玩遊戲中贏過人類，需要的禎數可能要很高，且例如射擊遊戲需要超高的反應速度，目前的強化學習可能還無法應付。
又或者自動駕駛，假設車子已經能完美的沿著路線前進了，且能應對紅綠燈等狀況，但如果因為某些原因，影像辨識誤把紅燈當成了綠燈，這樣可能會導致嚴重的事故。